Linguistische und semantische Annotation eines Zeitungskorpos
نویسندگان
چکیده
Zusammenfassung. Dieser Artikel beschreibt das Vorgehen beim automatischen inkrementellen Aufbereiten eines rohen Textkorpus mit linguistischer und semantischer Information. Es wird gezeigt, wie das Erkennen von Eigennamen hilft, die Wortartenkategorisierung und partielle syntaktische Analysen zu verbessern. Eine Evaluation über ca. 1’000 Sätze zeigt die Stärken und Schwachpunkte der verschiedenen Erkenner auf.
منابع مشابه
Automatische Erzeugung Semantischer Annotationen für Vorlesungsvideos
Die Anzahl der aufgezeichneten digitalen Vorlesungen nimmt rapide zu. Immer mehr Hochschuleinrichtungen nutzen die Möglichkeit, ihre Vorlesungen als Videos aufzuzeichnen, in multimedialen Datenbanken abzulegen und für den Zugriff über das Internet bereitzustellen. Bislang ist die detaillierte Suche in diesen Multimedia Daten jedoch nur begrenzt möglich. Der Hauptgrund hierfür ist in dem Umstand...
متن کاملSerengeti - Webbasierte Annotation semantischer Relationen
Der Artikel stellt zum einen ein Annotationsschema für semantische Relationen vor, das für die Beschreibung eines deutschsprachigen Korpus für Training und Evaluation eines Systems zur Anaphernauflösung entwickelt wurde, zum anderen wird das webbasierte Annotationstool Serengeti beschrieben, das zur Annotation anaphorischer Relationen im Projekt A „Sekimo“ eingesetzt wird. Im Gegensatz zu ande...
متن کاملExtraktion vom Metadaten als Basis für eine semantische Integration heterogener Informationssysteme
Dieser Beitrag beschreibt einen Ansatz für die Extraktion von Metadaten als Basis für eine semantische Integration von heterogenen Informationssystemen. Es handelt sich dabei um einen Teilbereich eines Ansatzes für die semantische Integration von strukturierten und unstrukturierten Daten am Beispiel eines Data Warehouse und eines Wissensmanagementsystems. Ziel dieses Beitrags ist es zu zeigen, ...
متن کاملDie semantische Gliederung als adäquate semantische Repräsentationsebene für einen sprachverstehenden 'Grafikeditor'
Zusammenfassung: In einem sprachverstehenden System soll der Bedeutungsinhalt einer gesprochenen Äußerung, die keinen Nebensatz enthält, mittels der semantischen Gliederung dargestellt werden. Diese setzt sich baumartig aus semantischen Untereinheiten (Semunen) zusammen. Sie ermöglicht es, innerhalb eines rein stochastischen ’Top-Down’-Ansatzes die Wahrscheinlichkeiten für die Emission von best...
متن کاملAutomatische Themenextraktion aus gesprochener Sprache
Bei vielen Formen der Kommunikation und Kooperation in Gruppensitzungen kann das Bereitstellen eines expliziten semantischen Kontextes wertvolle Unterstützung bieten. Semantische Kontexte können das gemeinsame Verständnis eines Problembereichs verbessern, die assoziative Ideenfindung unterstützen, eine moderierende Funktion in der Kommunikation übernehmen oder als Basis für Assistenzfunktionen ...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2001